检索结果

Select

1. 融合局部语义特征的学者细粒度信息提取方法

田悦霖, 黄瑞章, 任丽娜

《计算机应用》唯一官方网站 2023, 43 (9): 2707-2714. DOI: 10.11772/j.issn.1001-9081.2022091407

摘要（144）

HTML （12）

PDF （1296KB）（95）

从学者主页中提取的学者细粒度信息（如学者研究方向、教育经历等）在大规模专业人才库的创建等方面具有非常重要的应用价值。针对现有学者细粒度信息提取方法无法有效利用上下文语义联系的问题，提出一种融合局部语义特征的学者信息提取方法，利用局部范围文本的语义联系对学者主页进行细粒度信息抽取。首先，通过全词掩码中文预训练模型RoBERTa-wwm-ext学习通用语义表征；之后将通用语义表征中的目标句表征向量与局部相邻文本表征向量共同输入卷积神经网络（CNN）实现局部语义融合，从而获得更高维度的目标句表征向量；最终将目标句表征向量从高维度空间映射到低维度标签空间实现学者主页细粒度信息的抽取。实验结果表明，使用此融合局部语义特征的方法进行学者细粒度信息提取的宏平均F1值达到93.43%，与未融合局部语义的RoBERTa-wwm-ext-TextCNN方法相比提高了8.60个百分点，验证了所提方法在学者细粒度信息提取任务上的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于远距离监督和模式匹配的职衔履历属性抽取

于东, 刘春花, 田悦

计算机应用 2016, 36 (2): 455-459. DOI: 10.11772/j.issn.1001-9081.2016.02.0455

摘要（609）

PDF （1000KB）（915）

针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法。该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段。首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取。实验结果显示,所提方法在CLP2014-PAE测试集上的 F值达到55.37%,显著高于评测最好成绩( F值34.38%)和基于条件随机场(CRF)的有监督序列标注方法( F值43.79%),表明该方法能高覆盖度挖掘并抽取非结构化文档中的职衔履历属性。

参考文献 | 相关文章 | 多维度评价

Select

3. 一种基于蚂蚁算法的网络负载分担路由方法

肖晓丽田悦宏李振

计算机应用

摘要（1903）

PDF （550KB）（834）

针对蚁群算法(Ant Colony System，ACS)在网络负载分担方面的不足，提出了一种改进的蚁群算法。该算法在同一网络中使用多个标记的蚁群，各个蚁群之间的外激素相互抑制，同一蚁群的外激素相互促进，从而通过减少在最短路径上的蚁群外激素数量来实现路由的负载分担。最后通过实验验证了该方法的可行性，并给出了实验结果。